本文讨论了面部表达识别模型和描述生成模型,以构建图像中人的图像和面部表情的描述性句子。我们的研究表明,Yolov5比传统的CNN获得了KDEF数据集的所有情绪的更好结果。特别是,CNN和Yolov5模型的精度分别为0.853和0.938。使用VGG16与LSTM模型编码的描述提出了用于基于合并体系结构的图像描述的模型。 Yolov5还用于识别图像中对象的主要颜色,并在必要时纠正生成的描述中的颜色单词。如果描述包含指称一个人的单词,我们会认识到图像中人的情感。最后,我们结合了所有模型的结果,以创建描述图像中视觉内容和人类情感的句子。越南语中FlickR8K数据集的实验结果实现了BLLEU-1,BLEU-2,BLEU-3,BLEU-4分数为0.628; 0.425; 0.280;和0.174。
translated by 谷歌翻译
Three recent breakthroughs due to AI in arts and science serve as motivation: An award winning digital image, protein folding, fast matrix multiplication. Many recent developments in artificial neural networks, particularly deep learning (DL), applied and relevant to computational mechanics (solid, fluids, finite-element technology) are reviewed in detail. Both hybrid and pure machine learning (ML) methods are discussed. Hybrid methods combine traditional PDE discretizations with ML methods either (1) to help model complex nonlinear constitutive relations, (2) to nonlinearly reduce the model order for efficient simulation (turbulence), or (3) to accelerate the simulation by predicting certain components in the traditional integration methods. Here, methods (1) and (2) relied on Long-Short-Term Memory (LSTM) architecture, with method (3) relying on convolutional neural networks.. Pure ML methods to solve (nonlinear) PDEs are represented by Physics-Informed Neural network (PINN) methods, which could be combined with attention mechanism to address discontinuous solutions. Both LSTM and attention architectures, together with modern and generalized classic optimizers to include stochasticity for DL networks, are extensively reviewed. Kernel machines, including Gaussian processes, are provided to sufficient depth for more advanced works such as shallow networks with infinite width. Not only addressing experts, readers are assumed familiar with computational mechanics, but not with DL, whose concepts and applications are built up from the basics, aiming at bringing first-time learners quickly to the forefront of research. History and limitations of AI are recounted and discussed, with particular attention at pointing out misstatements or misconceptions of the classics, even in well-known references. Positioning and pointing control of a large-deformable beam is given as an example.
translated by 谷歌翻译
本文构成了新型的HyperGraph卷积神经网络基于聚类技术。该技术用于解决Citeseer数据集和CORA数据集的聚类问题。每个数据集都包含特征矩阵和HyperGraph的发射矩阵(即,由特征矩阵构造)。这种新颖的聚类方法利用了两个矩阵。最初,使用HyperGraph自动编码器将入射矩阵和特征矩阵从高维空间转换为低维空间。最后,我们将K-均值聚类技术应用于转换的矩阵。与其他经典聚类技术相比,基于Hypergraph卷积神经网络(CNN)的聚类技术在实验过程中的性能取得了更好的结果。
translated by 谷歌翻译
目的:为Kern等人提出的正弦线圈灵敏度模型提供封闭形式的解决方案。这种封闭形式允许对地面DEBIAS数据集的各种模拟偏置字段进行精确计算。方法:使用傅立叶分布理论和标准积分技术来计算线段磁场的傅立叶变换。结果:a $ l^1 _ {\ rm loc}(\ mathbb {r}^3)$函数在任意线段的几何形状中以完整的通用性得出。还讨论了采样标准和与原始正弦模型的等效性。最后,作者提供了CUDA加速实现$ \ texttt {biasgen} $。结论:由于派生的结果受到线圈定位和几何形状的影响,从业者将可以访问更多样化的模拟数据集生态系统,这些数据集可用于比较前瞻性偏见方法。
translated by 谷歌翻译
自我监督方法的下游精度与在训练过程中解决的代理任务以及从中提取的梯度的质量紧密相关。更丰富,更有意义的梯度更新是允许自我监督的方法以更有效的方式学习的关键。在典型的自我验证框架中,两个增强图像的表示在全球层面是连贯的。尽管如此,将本地线索纳入代理任务可能是有益的,并提高了下游任务的模型准确性。这导致了一个双重目标,一方面,全球代表之间的连贯性是强大的,另一方面,在本地代表之间的一致性得到了强大的一致性。不幸的是,两组局部代表之间的确切对应映射并不存在,这使得将局部代表从一个增强到另一个不平凡的任务匹配。我们建议利用输入图像中的空间信息获得几何匹配,并根据基于相似性匹配的几何方法与以前的方法进行比较。我们的研究表明,不仅1)几何匹配的表现优于低数据表格中的基于相似性的匹配,而且还有2)与没有局部自我验证的香草基线相比,基于相似性的匹配在低数据方面受到了极大的伤害。该代码将在接受后发布。
translated by 谷歌翻译
我们研究了使用前馈神经网络实施其支持集的同时近似紧凑型积分功能的问题。我们的第一个主要结果将这个“结构化”近似问题转录为普遍性问题。我们通过在空间上构建通常的拓扑结构来做到这一点,$ l^1 _ {\ propatatorName {loc}}(\ m athbb {r}^d,\ m athbb {r}^d)locally-intellable-intellable-intellable-intellable-intellable-in紧凑型函数只能通过具有匹配的离散支持的函数来近似于$ l^1 $ norm。我们建立了Relu Feedforwward网络的普遍性,并在此精致拓扑结构中具有双线性池层。因此,我们发现具有双线性池的Relu FeedForward网络可以在实施其离散支持的同时近似紧凑的功能。我们在紧凑型Lipschitz函数的致密亚类中得出了通用近似定理的定量均匀版本。该定量结果表达了通过目标函数的规律性,其基本支持的度量和直径以及输入和输出空间的尺寸来构建此relu网络所需的双线性池层层的深度,宽度和数量。相反,我们表明多项式回归器和分析前馈网络在该空间中并非通用。
translated by 谷歌翻译
定量融资中最基本的问题之一是存在适合给定一组选择的市场价格的连续时间扩散模型。传统上,人们采用直觉,理论和经验分析的组合来找到实现精确或近似拟合的模型。我们的贡献是展示该问题的合适游戏理论表述如何通过利用现代深层多代理强化学习中的现有发展来帮助解决这个问题,以在随机过程的空间中进行搜索。更重要的是,我们希望社区可以利用和扩展我们的技术来解决该领域的重要问题,例如SPX-VIX校准问题。我们的实验表明,我们能够学习局部波动性,以及在波动率过程中所需的路径依赖性,以最大程度地降低百慕大选项的价格。在一句话中,我们的算法可以看作是粒子方法\`{a} la Guyon et henry-labordere,而粒子而不是被设计为确保$ \ sigma_ {loc}}(t,s_t)^2 = \ mathbb { e} [\ sigma_t^2 | s_t] $,正在学习与更通用校准目标合作的RL驱动的代理。这是第一批使用衍生校准问题桥接加固学习的工作。
translated by 谷歌翻译
先进的制造技术使生产材料具有最先进的性质。然而,在许多情况下,这些技术的物理学模型的发展落后于实验室的使用。这意味着设计和运行实验在很大程度上通过试验和错误进行。这是次优,因为实验是成本 - ,时间和劳动密集型的。在这项工作中,我们提出了一种机器学习框架,差异属性分类(DPC),使实验者能够利用机器学习的无与伦比的模式匹配能力来追求数据驱动的实验设计。 DPC采用两种可能的实验参数集,并输出预测,其将产生具有由操作员指定的更可望的属性的材料。我们展示了DPC对AA7075管制造工艺和机械性能数据的成功,使用剪切辅助加工和挤出(形状),固相处理技术。我们表明,通过重点关注多个候选实验参数之间的选择,我们可以重新预测从处理参数预测材料属性的具有挑战性的回归任务,进入哪个机器学习模型可以实现良好性能的分类任务。
translated by 谷歌翻译
人脸识别是模式识别区域中非常重要的领域。它在军事和金融中有多种申请,名称为几个。在本文中,将提出与最近邻的方法的稀疏PCA的组合(以及与内核脊回归方法),并将应用于解决面部识别问题。实验结果表明,稀疏PCA方法的组合(使用近端梯度法和FISTA方法)和一个特定分类系统的准确性可能低于PCA方法和一个特定分类系统的组合的精度,但有时稀疏PCA方法的组合(使用近端梯度法或Fista方法)和一个特定的分类系统导致更好的准确性。此外,我们认识到,使用Fista方法计算稀疏PCA算法的过程总比使用近端梯度方法计算稀疏PCA算法的过程。
translated by 谷歌翻译
本文介绍了伯特嵌入法和图形卷积神经网络的新方法。采用这种组合来解决文本分类问题。最初,我们将BERT嵌入方法应用于文本(在BBC新闻数据集和IMDB电影评论数据集)中,以便将所有文本转换为数字向量。然后,图形卷积神经网络将应用于这些数字向量,以将这些文本分类为其AP的兴趣类/标签。实验表明,图形卷积神经网络模型的性能优于具有CLAS-SICE机器学习模型的BERT嵌入方法的组合的性能。
translated by 谷歌翻译